Световни новини без цензура!
OpenAI казва, че работи върху AI, който имитира човешки гласове
Снимка: cnn.com
CNN News | 2024-04-02 | 23:33:38

OpenAI казва, че работи върху AI, който имитира човешки гласове

OpenAI показа нов инструмент за изкуствен интелект, който може да имитира човешки гласове със стряскаща акуратност. Генераторът на AI глас има набор от евентуални приложения, в това число за услуги за досегаемост, само че също по този начин може да провокира опасения по отношение на дезинформация и други форми на корист.

OpenAI в петък показа проби от ранните проби на инструмента, наименуван Voice Engine, който употребява 15-секундна извадка от някой, който приказва, с цел да генерира безапелационна имитация на неговия глас. След това потребителите могат да дават параграф от текст и инструментът ще го прочете в гласа, генериран от AI.

Има няколко гласови услуги, генерирани от изкуствен интелект, които към този момент са налични за обществеността, само че, както се случи с пробивния чатбот ChatGPT, OpenAI се оказа изключително ловък в набирането на необятно приемане на принадлежности за изкуствен интелект.

Инструмент за превръщане на текст към глас с AI може да помогне с превод, помощ при четене за деца или подкрепяне на хора, които са изгубили способността си да приказват, споделя компанията. Но някои скептици се тормозят, че това може също да подхрани основаването на дезинформация или да улесни осъществяването на измами.

OpenAI споделя, че Voice Engine сега се употребява единствено от „ дребна група доверени сътрудници “, в това число компании за просветителни и здравни технологии, и ще употребява техните проби, с цел да дефинира дали и по какъв начин да разреши по-широко потребление. Тези тестери са се съгласили да не пресъздават гласовете на хората без тяхното категорично единодушие и ясно да разпознават на слушателите, че това, което чуват, е генерирано от AI, съгласно компанията.

„ Ние осъзнаваме, че генерирането на тирада, която прилича гласовете на хората, крие съществени опасности, които са изключително значими в година на избори “, сподели OpenAI в обява в блог. Компанията призна нуждата от огромни промени, защото аудиото, генерирано от AI, става все по-широко налично, макар че не възнамерява да пусне гласовия мотор на обществеността неотложно. Например, компанията предложи последователно унищожаване на гласово засвидетелствуване за банкови сметки.

„ Всяко необятно разрастване на синтетична гласова технология би трябвало да бъде съпроводено от преживявания за засвидетелствуване на глас, които удостоверяват, че истинският представител умишлено прибавя гласа си към услугата и лист със неразрешени гласове, който открива и предотвратява основаването на гласове, които са прекомерно сходни на видните числа “, сподели OpenAI.

Voice Engine може да употребява гласова проба на един език, с цел да сътвори имитация на глас, която може да приказва на голям брой други езици.

Публикацията в блога му включва образец за аудио клип на човек, който чете откъс за другарството, дружно с генерирано от AI аудио, което звучи като същия човек, който чете същия откъс на испански, мандарин, немски, френски и японски. Във всяка от семплите, генерирани от AI, тонът и акцентът на истинския представител се резервират.

По-долу са аудио образци от OpenAI, които демонстрират по какъв начин работи Voice Engine. Първият аудио клип е действителната човешка тирада, която е употребена като вход за инструмента.

Това е клипът на същински човешки глас, въведен в Voice Engine на OpenAI.

Източник: OpenAI

Следващият аудио клип е генерираният от AI глас, основан от Voice Engine въз основа на горната човешка тирада и писмен абзац, който споделя на машината какво да каже.

Това е полученият гласов клип, генериран от AI, генериран от Voice Engine въз основа на човешка извадка.

Източник: OpenAI

Визуализацията на Voice Engine идва, до момента в който потребителите чакат общественото стартиране на Sora, видео инструментът, генериран от AI, който OpenAI нервира предишния месец. Sora може да основава реалистично изглеждащи 60-секундни видеоклипове от текстови указания, с опцията да сервира подиуми с голям брой герои, характерни видове придвижване и комплицирани елементи на фона. ChatGPT на OpenAI може също да генерира изображения от текстова подкана.

Отделно, OpenAI също разгласи в понеделник, че прави ChatGPT наличен за всеки, без да е належащо да се регистрирате, с цел да употребявате услугата.

Компанията означи, че може да употребява всеки текст, който е зареден в ChatGPT, с цел да усъвършенства своите модели, само че сподели, че това може да бъде изключено посредством настройки даже без акаунт. Без акаунт обаче потребителите няма да могат да резервират или преглеждат историята на чатовете или да имат достъп до разнообразни функционалности, в това число гласови диалози и персонализирани указания.

– Саманта Кели от CNN способства за този отчет.

Източник: cnn.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!